{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 19,
   "metadata": {
    "collapsed": false
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 文书写作一本通\n作者： 雪花\n链接： http://www.duokan.com/book/97181\n封面： http://cover.read.duokan.com/mfsv2/download/s010/p01flcjDdv1A/7rVxNuAJ0P4Pn9.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/97181\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 心灵地图\n作者： 裴玲\n链接： http://www.duokan.com/book/123069\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01Wd0E4GMon/gMuONgWQLqgMCj.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/123069\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 知乎周刊·原生家庭：爱与痛的起点（总第207期）\n作者： 知乎编辑团队\n链接： http://www.duokan.com/book/173282\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01uLYQyGhZd/OLrfdXxWbnfb2m.jpg!l\n阅读： \n\n\n书名： 心宽路就宽\n作者： 江乐兴\n链接： http://www.duokan.com/book/123118\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01jDA5cgLI7/2SFEsnVuvn4O9t.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/123118\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 新疆游记\n作者： 谢晓钟\n链接： http://www.duokan.com/book/128070\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01GXO4EUK9D/w0To9LW3cvbMD7.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/128070\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 西北考察日记\n作者： 谢晓钟\n链接： http://www.duokan.com/book/128071\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p018cWh9dKpW/7Xpz6rr7wPGV2P.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/128071\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 紫禁丹青：清宫绘画的创作与收藏\n作者： 李湜\n链接： http://www.duokan.com/book/152949\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01lAmXWP6P4/FdiXfp9hYNEXDe.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/152949\">立即支付</a>\n\n\n书名： 大唐的裂变·遍地诸侯\n作者： 王澄明黎晓春\n链接： http://www.duokan.com/book/128015\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01xomdQ8akM/GM0Ghaw8BwToFN.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/128015\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 读着英语去哈佛\n作者： 沈玉强\n链接： http://www.duokan.com/book/128053\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01JZYljuZFs/PTrEPM4tDTCe3b.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/128053\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 响窑\n作者： 叶雪松\n链接： http://www.duokan.com/book/128068\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01fFXD5qlGx/1C3vZCUqRobvJB.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/128068\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： （外国文学微阅读·西方恐怖小说精选）灵异肖像画\n作者： 蒋方洲朱德僡（编译）\n链接： http://www.duokan.com/book/113286\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01prNdtL46m/f0yyFq2fobqqnT.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/113286\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 神探夏洛克 5\n作者： 【英】阿瑟·柯南·道尔【英】本尼迪克特·康伯巴奇\n链接： http://www.duokan.com/book/105646\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01aT7sl92mT/pVqKTAVYjlAms1.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/105646\">立即支付</a>\n\n\n书名： 凡·高的向日葵：余光中散文\n作者： 余光中\n链接： http://www.duokan.com/book/162580\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01vU1Qel8E4/1hz0NXM6PuDrWV.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/162580\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 谈判说服力\n作者： 李力刚\n链接： http://www.duokan.com/book/43030\n封面： http://cover.read.duokan.com/mfsv2/download/s010/p018kYLBoAwZ/FbLZKaoIlu1DRp.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/43030\">立即支付</a>\n\n\n书名： 一个民企CEO的职场阳谋\n作者： 天外天\n链接： http://www.duokan.com/book/43028\n封面： http://cover.read.duokan.com/mfsv2/download/s010/p017He85bBvp/C9zgDDrZNV8Yfl.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/43028\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 中国企业怎么管\n作者： 曾仕强\n链接： http://www.duokan.com/book/76154\n封面： http://cover.read.duokan.com/mfsv2/download/s010/p01bvlGpQPxH/ao1ovJApmp4tqJ.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/76154\">立即支付</a>\n\n\n书名： 海底捞的秘密\n作者： 易钟\n链接： http://www.duokan.com/book/63358\n封面： http://cover.read.duokan.com/mfsv2/download/s010/p0164DmQPKUa/TIZGUCmvYFsxRw.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/63358\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 知乎周刊·好仪态，日常生活练出来（总第206期）\n作者： 知乎编辑团队\n链接： http://www.duokan.com/book/172472\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p011LxTDvC3E/nYibS0auhqiA05.jpg!l\n阅读： \n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 人脉关系课\n作者： 曾仕强刘君政\n链接： http://www.duokan.com/book/1282\n封面： http://cover.read.duokan.com/mfsv2/download/s010/p017z8gUenuQ/uwj66i1Q51ax4j.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/1282\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： 神探夏洛克 4\n作者： 【英】阿瑟·柯南·道尔【英】斯蒂芬·汤普森\n链接： http://www.duokan.com/book/105647\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01Z4H4CMmgV/Z2p7rTdapUcavh.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/105647\">立即支付</a>\n\n\n书名： 你的推销能力价值百万（金源著）\n作者： 金源\n链接： http://www.duokan.com/book/167898\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01DxA2z1NMo/p4x7T8tZHd9oj8.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/167898\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： FBI微反应心理学\n作者： 金圣荣\n链接： http://www.duokan.com/book/167744\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01KDjvtA6aR/v3uKSVPpBYtmY6.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/167744\">立即支付</a>\n\n\n书名： 给心灵洗个澡\n作者： 滕龙江\n链接： http://www.duokan.com/book/167878\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01P0apLBvHP/HpeJCBnkY0CRbk.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/167878\">立即支付</a>\n\n\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "书名： FBI超级询问学\n作者： 金圣荣\n链接： http://www.duokan.com/book/167743\n封面： http://cover.read.duokan.com/mfsv2/download/fdsc3/p01a3CF6AgBO/AqNjBxhpqUu6dm.jpg!l\n阅读： <a class=\"u-btn2 j-buy\" hidefocus=\"hidefocus\" href=\"/pay/167743\">立即支付</a>\n\n\n"
     ]
    }
   ],
   "source": [
    "import requests\n",
    "from bs4 import BeautifulSoup\n",
    "url = r'C:\\Temp\\duokan\\mybook-0.html'\n",
    "htmlfile = open(url, 'r', encoding='UTF-8')\n",
    "htmlpage = htmlfile.read()\n",
    "htmlfile.close()\n",
    "soup = BeautifulSoup(htmlpage, 'html5lib')\n",
    "for book in soup.select('.u-bookitm1-1'):\n",
    "    book_title = book.select('.title')[0].text\n",
    "    book_author = book.select('.u-author')[0].text\n",
    "    book_url = book.select('.title')[0]['href']\n",
    "    cover = requests.get(book_url)\n",
    "    cover.encoding = 'utf-8'\n",
    "    soup_cover = BeautifulSoup(cover.text, 'html5lib')\n",
    "    book_img = soup_cover.select('.book-wrap')[0].select('img')[0]['src']\n",
    "    #print('链接：', book_url)\n",
    "    if len(soup_cover.select('.u-btn2')) > 0 :\n",
    "        book_reader = soup_cover.select('.u-btn2')[0]\n",
    "    else:\n",
    "        book_reader = ''\n",
    "    print('书名：', book_title)\n",
    "    print('作者：', book_author)\n",
    "    print('链接：', book_url)\n",
    "    print('封面：', book_img)\n",
    "    print('阅读：', book_reader)\n",
    "    #print(cover.text)\n",
    "    #cover.encoding = 'utf-8'\n",
    "    print('\\n')\n",
    "# print(lis[0].text)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [],
   "source": []
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.5"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 1
}
